Bases psychocognitives de la visualisation de données

Exercice 1

Open data

De nombreuses institutions publiques mettent à disposition leurs données. C'est un acte de transparence mais aussi une façon de permettre à tout un chacun de contribuer à la transition numérique via le développement de services basés sur des outils de visualisations et d'analyses spécialisés.

Consulter le site https://data.angers.fr/

Exporter pour chacune des types de variables (nominale, ordonnée et quantitative), une visualisation en accord avec la taxonomie de Mackinlay et une visualisation ne respectant pas cette taxonomie.

Rappel de définition

Attributs nominaux :

Valeurs parmi un ensemble (fini ou non) qui ont pour seule comparaison possible l’identité. Exemple : nom d’une personne (nombre infini de valeurs possibles), ou son sexe (H ou F).

Exemple:

Nom d’une personne (nombre infini de valeurs possibles), ou son sexe (H ou F).

Attributs ordonnés :

Pour deux valeurs on peut tester l’intensité mais aussi laquelle est la plus petite.

Exemple:

echelle de Likert « pas du tout d’accord », « pas d’accord », « indifférent », « d’accord », « tout à fait d’accord », taille des vêtements,..

Attributs quantitatifs : Définition:

Pour deux valeurs on peut tester l’identité, l’ordre et mesurer des différences.

Article de Mackinley

Attributs ordonnée

Pour cela nous allons utilisé une base de donnée sur la nomenclature des déchets

Mauvaise représentation

En effet, nous disposons bien de toutes les informations:

En revanche, le choix d'une ligne n'est pas judicieux

nous avons une impression de continuité là ou il n'y en a pas.

et celui de la couleur non plus.

On ne voit pas très bien les valeurs

Bonne représentation

Cela me semble être une bonne représentation, les blocs sont bien représentatifs de la quantité de chaque déchet.

Bloc volumineux implique beaucoup de déchets de ce type

La séparation est bien effectuée,

La couleur nous permet de directement identifier les différents blocs

Il y a un sens de lecture du déchet avec le plus haut compte vers le plus faible.

Du haut vers le bas et de la droite vers la gauche Qui plus est, ce sens de lecture nous est implicitement donné par la continuité.

Attributs nominaux

Pour cela nous allons utilisé une base de données sur un indice de qualité de l'air de la ville d'angers allant de: 1

air très bon

à 10:

air très mauvais

Sur la période du 1er Janvier 2020 au 31 décembre 2020.

Mauvaise représentation

Nous disposons bien de toutes les informations comme vous pouvez le voir:

En revanche, ceci est peu pertinent pour les raisons suivantes:

Bonne représentation

Cette représentation en barre semble beaucoup plus pertinente:

Attributs quantitatifs

POur cela nous allons utilisé une base de données sur les états civils à angers De début 2003 à début 2020 et nous intéresser au nombre de naissance.

Mauvaise représentation

Ce diagramme en camembert représente bien les bonnes informations. Cependant, il n'est pas du tout optimisé. En effet:

Bonne représentation

Cette représentation semble bien meilleure, en effet:

Exercice 2

L'énoncé est le suivant:

Reproduire par vous même les graphes que vous aurez exportés dans l'exercice 1.

N'appréciant pas particulièrement la syntaxe de R, je vais tenter de reproduire tout cela sur python3.

Attributs nominaux

Mauvaise représentation

Les représentations affichées ne sont certes pas identiques, mais je considère qu'elles sont aussi bonnes (ou mauvaises, selon le point de vue)